# Autour du Laplacien

On a déjà vu que la matrice d'adjacence d'un graphe permettait de construire des algorithmes efficaces pour résoudre certains problèmes, comme la recherche de chemins ou de composantes connexes.

Ce n'est pas la seule matrice intéressante pour l'étude d'un graphe.
Comme on l'a vu en cours, on peut définir une matrice que l'on appelle **la matrice laplacienne du graphe**.
Cette matrice est la matrice suivante :
$$L = D - A,$$
où $A$ est la matrice d'adajcence du graphe, et $D$ une matrice diagonale contenant les degrés de chacun des sommets.

Dans ce TP, on va essayer de comprendre ce qui motive la définition d'une telle matrice, et voir ce qu'on peut tirer de ces problèmes là.

In [None]:
import networkx as nx
import numpy as np
import matplotlib.pyplot as plt

In [None]:
def liste_adjacence(G):
 adj = {}
 
 for sommet, adjacence in G.adjacency():
 adj[sommet] = adjacence.keys()
 
 return adj

## Dessiner Un Graphe
### Quelques Exemples

Jusqu'ici, on a utilisé la fonction `nx.draw` pour afficher des graphes.
Si vous regardez bien, on a souvent appelé cette fonction avec un argument `pos`.

Par exemple, on avait regardé ce graphe :

In [None]:
# génération d'un graphe
G = nx.connected_caveman_graph(4,4)

# calcul des positions des sommets du graphe
pos = nx.spring_layout(G, seed=42)

# affichage
nx.draw(G, pos=pos, edgecolors="black", node_color="pink", with_labels=True)

Ici, on a appelé la fonction `nx.draw` avec l'argument `pos = nx.spring_layout(G, seed=42)`.
On va voir comment cette fonction calcule les positions des points.

Mais d'abord, regardons ce qu'il se passe si on donne une position aléatoire à chacun des poids :

In [None]:
# génération de positions aléatoires
rng = np.random.default_rng(seed=42)
pos_aleatoire = {u: rng.normal(size=2) for u in G.nodes()}

# affichage
nx.draw(G, pos=pos_aleatoire, edgecolors="black", node_color="pink", with_labels=True)

On comprend tout de suite beaucoup moins ce qu'il se passe dans ce graphe...

### Un Problème d'Optimisation

Pour résoudre ce type de problèmes, une approche assez efficace consiste à utiliser des méthodes d'optimisations.
Généralement, on définit une fonction qui dépend de nos données (ici de notre graphe), et d'un ensemble de paramètres.
On cherche alors les paramètres qui minimisent cette fonction, ce qui, si on a bien défini la fonction, permet de trouver une solution à notre problème.

Le problème est alors un problème de la forme :
$$ \min_{v \in \mathbb{R}^n} f(v; données).$$

Si $f$ est différentiable, on peut calculer le gradient $\nabla f$ de $f$.
Ce gradient est intéressant, car il pointe dans la direction où $f$ augmente le plus vite.
Ainsi, l'opposé du gradient $-\nabla f$ pointe dans la direction où $f$ diminue le plus vite.

La méthode la plus simple pour résoudre ce problème est la descente de gradient.
On part d'une valeur des paramètres $v_0$, puis on avance dans la direction du gradient avec un pas $\eta > 0$ :
$$ v_{t+1} = v_t - \eta \nabla f(v_t).$$

Par exemple, pour calculer la moyenne d'un ensemble de vecteurs $x_1, \dots, x_K$, chacun ayant $n$ éléments, on a vu qu'on pouvait résoudre le problème :
$$ \min_{v \in \mathbb{R}^n} f(v) := \frac {1}{2} \sum_{i=1}^n \|v - x_i\|_2^2,$$
où $v$ et $x_i$ sont des vecteurs de taille $d$.

On peut calculer le gradient de $f$ :
$$ \nabla f(x) = \sum_{i=1}^n w - x_i.$$

**Exemple.**
Les deux fonctions suivantes calculent la valeur de $f$ et de son gradient.

In [None]:
def f(v, x):
 # v est un réel
 # x est une liste de réels
 
 return 0.5 * np.sum(np.linalg.norm(v - x, axis=1) ** 2)

def grad_f(v, x):
 return np.sum(v - x, axis=0)

Puis, on peut utiliser l'algorithme de descente de gradient suivant pour trouver la moyenne de nos valeurs :

In [None]:
def descente_gradient(x, f, grad, v0, nb_iter=5, eta=0.001):
 
 # on copie la valeur initiale pour éviter de la modifier sans faire exprès
 v = v0.copy()
 
 for t in range(nb_iter):
 
 # mise à jour avec le gradient
 v = v - eta * grad(v, x)
 
 return v

In [None]:
# génération de données aléatoires
rng = np.random.default_rng(seed=42)
x = rng.random(size=(1000,2))

# calcul de la moyenne par descent de gradient
v = descente_gradient(x, f, grad_f, np.zeros(2), nb_iter=5, eta=0.001)

In [None]:
print("Vraie moyenne : ", np.mean(x, axis=0))
print("Moyenne calculée par notre algorithme : ", v)

**Question.** Modifiez la fonction `descent_gradient` pour garder en mémoire la valeur de la fonction $f$ à chaque itération.
Affichez ensuite une courbe qui montre l'évolution de la fonction $f$ au cours des itérations.

In [None]:
def descente_gradient_mem(x, f, grad, v0, nb_iter=5, eta=0.001):
 # impélmentez la fonction

In [None]:
# affichez la courbe des valeurs de f au fil des itérations

**Question.** Regardez ce qu'il se passe quand :
* vous augmentez ou diminuez le learning rate $\eta$ ;
* vous changez le nombre d'itérations.

Commentez.

In [None]:
# on pourra utiliser plt.subplots pour afficher plusieurs côte à côte :
# fig, ax = plt.subplots(1, 2, figsize=(15, 5))

## Calcul de la position des sommets du graphe

Dans cette partie, on associe une valeur $v_s$ à chacun des points, où $v_s$ est un vecteur de longueur $2$, représentant la valeur des abscisses $x = v_s[0]$ et des ordonnées $y = v_s[1]$ de chacun des sommets du graphe.

On a vu en cours que l'on pouvait trouver de bonnes valeurs pour $v_s$ en minimisant la fonction suivante :
$$L(v; G) = \frac 12 \sum_{s \in V} \sum_{(s, s') \in E} \|v_s - v_{s'}\|^2,$$
en prenant soin de fixer la valeur de $v_s$ pour certains sommets.

Le problème que l'on cherche à résoudre est donc maintenant un peu différent, car on cherche à calculer les valeurs de $x$ et $y$ pour chacun des points.
On a donc $2n$ variables.

Le coefficient $s$ du gradient de la fonction $L$ est :
$$ \nabla_{v_s} L(v; G) = 2 \sum_{(s, s') \in E} (v_s - v_{s'}),$$
où l'on aura pris bien soin d'utiliser la valeur que l'on veut imposer à $v_{s'}$, et non un autre valeur !

Les fonctions suivantes permettent de calculer la valeur de $L$ et son gradient, avec certaines valeurs fixées.

In [None]:
def L(G, v, fixed_v):
 
 # on remplace les valeurs fixes de v par les valeurs fixes
 v = v.copy()
 for k in fixed_v:
 v[k] = fixed_v[k]
 
 # calcul de la matrice d'adjacence
 adjacency_matrix = nx.adjacency_matrix(G)
 
 # calcul de la matrice diagonale des degrés
 degree_matrix = np.diag(np.ravel(np.sum(adjacency_matrix, axis=1)))
 
 # calcul de la matrice laplacienne
 lap = degree_matrix - adjacency_matrix
 
 # renvoyer la valeur de la fonction
 return np.trace(0.5 * v.T @ lap @ v)

def grad_L(G, v, fixed_v):
 
 # intiialisation
 adj = liste_adjacence(G)
 grad = np.zeros(v.shape)
 
 v = v.copy()
 for k in fixed_v:
 v[k] = fixed_v[k]
 
 # on calcule les coordonnées du gradient une par une
 for s in G.nodes():
 
 # si s est fixé, le gradient doit rester nul !
 if s not in fixed_v:
 
 # calcul...
 for s2 in adj[s]:
 grad[s] += 2 * (v[s] - v[s2])
 
 return grad

**Question.** Adaptez la fonction `descent_gradient` pour qu'elle prenne en entrée :
* un graphe $G$ ;
* la fonction $L$ et son gradient $grad\_L$ ;
* une matrice de taille $(n, 2)$ contenant les positions initiales de chacun des sommets (c'est $v_0$) ;
* un dictionnaire $fixed\_v$ dont les clés sont les sommets que l'on veut garder fixes, et qui associe à ces sommets leurs coordonnées (qui ne doivent donc pas bouger) ;
* le learning rate $\eta$ ;
* le nombre d'itération $nb\_iter$ ;

et qu'elle renvoie les positions finales des sommets.

*On fera bien attention à prendre en compte les valeurs fixes de $v$*.

In [None]:
def descente_gradient_mat(G, f, grad, v0, fixed_v, nb_iter=5, eta=0.001):
 # implémentez la fonction

**Question.**
Appelez votre fonction sur le graphe $G$, en plaçant le sommet $1$ en $(10, 0)$, le sommet $5$ en $(0, 10)$, le sommet $9$ en $(0, 0)$ et le sommet $13$ en $(10, 10)$. (Ces valeurs sont définies dans la variable `fixed_v`.)

Affichez la valeur de la fonction $L$ au fur et à mesure, ainsi que 

Vous pourrez lancer l'algorithme avec un learning rate $eta = 0.1$ et pour $100$ itérations.

In [None]:
# valeurs fixées de v
fixed_v = {1: [10,0], 5: [0,10], 9: [0,0], , 13: [10,10], }

# valeurs initiales de v
v = np.zeros((len(G.nodes()), 2))


### calculez la bonne valeur des positions

**Question.** Affichez votre graphe avec les positions que vous avez calculées, en appelant la fonction `nx.draw` en donnant les valeurs que vous avez calculées à l'argument `pos`. Commentez.

In [None]:
# affichez le graphe avec les positions calculées à la question précédent

**Remarque.** Pour comparer, voilà ce que l'on obtient avec la fonction de `networkx` qui procède de la même façon.
Le résultat est différent car cette fonction ne fixe aucun point, mais cherche à laisser une distance minimale entre les sommets.
Néanmoins le principe du calcul reste le même.

On remarquera que "spring" signifie "ressort" en anglais, et que le nom de cette fonction vient du fait que l'on cherche à calculer les positions en considérant les arêtes comme des ressorts.

In [None]:
pos = nx.spring_layout(G)
nx.draw(G, pos=pos, with_labels=True, edgecolors="black", node_color="pink")

## Utilisation du spectre de la matrice laplacienne

Dans cette partie, on va s'intéresser au spectre de la matrice laplacienne du graphe.

**Question.** Commencez par définir une fonction qui prend en entrée un graphe et qui renvoie sa matrice laplacienne :

In [None]:
def matrice_laplace(G):
 
 # renvoyer la matrice laplacienne de G

**Question.** Affichez la matrice laplacienne du graphe `G` d'au dessus. Commentez les valeurs des coefficients de cette matrice.

La fonction `np.linalg.eig` permet de calculer les valeurs propres d'une matrice, ainsi que les vecteurs propres associés.
Elle renvoie un tuple dont le premier élément est la liste des valeurs propres de la matrice, et donc le second élément est une matrice dont les **colonnes** sont les vecteurs propres correspondants à ces valeurs propres.

**Question.** Codez une fonction qui prend en entrée une matrice, puis qui utilise `np.linalg.eig` pour en calculer les valeurs propres, et qui les renvoie triés par ordre de valeur propre croissante.

In [None]:
def val_vec_propres(mat):
 # calculer et trier les valeurs propres

Constatez que la plus petite valeur propre est bien nulle.

**Question.** Pour afficher le graphe, on peut prendre les vecteurs propres correspondant aux deux plus petits valeurs propres non nulles. Le premier vecteur sera les abscisses des sommets, et le second leurs ordonnées.
Affichez le graphe `G` de cette façon.

Comparez ce que vous obtenez avec la fonction `nx.draw_spectral`, qui fait exactement les mêmes opérations.

In [None]:
# afficher G avec comme positions les valeurs des vecteurs propres appropriés

In [None]:
# pour comparer :
nx.draw_spectral(G, edgecolors="black", node_color="pink", with_labels=True)

**Remarque.** Quand le graphe n'est pas connexe, le nombre de valeurs propres nulles indique le nombre de composantes connexes.

**Question.** Regardez les valeurs des valeurs propres obtenues pour le graphe suivant :

In [None]:
G_non_connexe = nx.caveman_graph(3,3)
nx.draw(G_non_connexe, edgecolors="black", node_color="pink", with_labels=True)

**Remarques.**
La matrice Laplacienne d'un graphe est très utile en pratique.
Ses vecteurs propres sont particulièrement intéressants, car, comme vous l'avez vu pour dessiner les graphes, elles contiennent des informations bien structurées sur le graphe.

En particulier, on pourra s'en servir pour projeter des données en plus petite dimension, ce qui est particulièrement utile pour visualiser des données en dimension plus grande que 2.

Cette matrice se retrouve aussi dans des algorithmes de clustering, et permet de capturer des informations sur la géométrie des clusters à retrouver.

On va parler de tout ça dans les prochains cours.